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海子 水 牛 瘤胃 微生物 的 宏基 因 组 学 分 析 
Kee BRA 黄 m 绪 欣 tk $ F 杨 章平 ” 


(扬州 大 学 动物 科学 与 技术 学 院 ， 扬 州 225009) 


摘 要 : 为 系统 探讨 海子 水 牛 瘤胃 内 的 微生物 组 成 及 木质 纤维 素 降 解 酶 系 , 本 试验 利用 基于 
高 通 量 测序 的 宏基 因 组 学 技术 对 海子 水 牛 〈2.5 岁 左右 ， 平 均 体 重 为 493 kg) R ARER 


行 组 学 分 析 。 结 果 表 明 , 共 获得 了 77 283 638 条 reads, 并 拼接 出 744 712 个 scaffold。 经 prodigal 


分 析 后 ， 共 预测 出 827 044 个 基因 。 通 过 基因 注释 发 现 海子 水 牛 瘤胃 中 含有 多 种 木质 纤维 素 


降解 微生物 ， 如 生 黄 瘤胃 球菌 CRuminococcus flavefaciens) ~ A EJA AERE CRuminococcus 


albus) 、 jt $22 Fibrobacter succinogenes TUE EX BI Prevotella 
Ibus) 、 产 琥珀 酸 丝 状 杆菌 CFibrob ) 及 栖 瘤胃 普 雷 沃 氏 菌 《 Il 


ruminicola) 。 此 外 ， 还 发 现 有 38 011 个 基因 编码 蛋白 具有 木质 纤维 素 降解 酶 活性 ， 其 中 糖 


苷 水 解 酶 (GHD 基因 数量 最 多 (17 877 个 )， 糖 基 转 移 酶 (GT) (8 637 个 ) 、 碳 水 化 合 物 


结合 模块 (CBM) (4 693 个 ) 和 碳水 化 合 物 酯 酶 CE) 基因 (4 214 个 ) 次 之 ， 多 糖 裂 合 酶 


CPL) (1 296 4S) 和 辅助 氧化 还 原 酶 (AA) 基因 (934 个 ) 较 少 。 在 GH 基因 中 ， 归 属于 


GH2. GH43. GH97. GH3 家 族 的 基因 较 多 ， 且 编码 蛋白 具有 究 糖 降解 酶 活性 的 基因 数量 最 


多 。 此 外 还 发 现 了 少量 的 纤维 小 体 组 分 蛋白 基因 。 结合 其 他 物种 肠胃 宏基 因 组 中 GH 基因 比 


对 分 析 , 发 现 海子 水 牛 瘤胃 中 的 纤维 素 酶 、 半 纤维 素 酶 和 分 支 降解 酶 比例 与 奶牛 瘤胃 较为 接 


近 。 由 此 可 见 ， 海 子 水 牛 瘤胃 内 含有 丰富 的 木质 纤维 素 降 解 微生物 及 酶 系 ， 这 将 为 筛选 具有 


工业 应 用 潜力 的 酶 基因 奠定 理论 基础 。 


关键 词 : 海子 水 牛 ;， 瘤胃 ; 宏基 因 组 ， 微生物， 木质 纤维 素 降解 酶 


中 图 分 类 号 :S823 


木质 纤维 素 是 含有 纤维 素 、 半 纤维 素 、 木 质 素 等 成 分 的 植物 生物 质 的 统称 趾 。 冶 骨 是 
然 界 中 降解 木质 纤维 素 能 力 最 强 的 生态 系统 之 一 , 能 够 在 48 h 内 降解 饲 粮 中 60%~65% 的 木质 
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VR 


和 十 细菌 ， 也 


潜力 的 木质 


糖苷 酶 及 木 糖苷 酶 


骨 基 因 资 源 的 探索 研究 。 


HW EKAI EP, 


HOG PE. Huang J jj 3 
瘤胃 是 一 个 严格 大 氧 的 环境 , 绝 大 多 数 


瘤胃 是 一 座 巨 


卉 中 的 微生物 组 成 、 代 谢 通路 研究 


随 着 高 通 量 测 


年 首次 对 奶牛 瘤胃 微生物 的 宏基 因 组 ; 


目前 ， 已 有 许多 应 用 高 通 量 测 


FERWER, Z 


千 维 素 ， 为 反刍 动物 提供 营养 物质 , 可 见 瘤胃 内 蕴藏 着 丰富 的 木质 纤维 素 降 解 微生物 
中 ,瘤胃 内 微生物 种 类 繁多 、 数 量 巨 EE 


EF 瘤胃 中 获得 了 一 种 嗜 低温 的 木 聚 糖 酶 基 
府 胃 微生物 是 不 可 培养 的 , 这 就 大 大 限制 了 人 


超过 3 000 种 微生物 ， 既 包括 细菌 、 原 虫 、 


MER 


的 生物 资源 库 ， 蕴 藏 着 许多 有 上 有 具有 工业 应 
纤维 素 降 解 酶 系 。 Zhou 等 由 从 先 牛 瘤胃 中 发 现 了 


一 个 双 功 能 酶 , 同时 具 


有 和 葡萄 


因 。 但 


基因 组 


以 及 酶 蛋白 的 功能 分 析 等 四 。 
FRA A A SE AMA 


[测序 已 


的 基因 最 多 ， 
质 纤维 素 降解 


通 量 测序 ， 结 


而 含有 黏 连 模块 和 对 接 模 


果 发 现 青草 组 的 水 牛 


功 运 用 于 分 析 


行 了 测序 ， 共 发 现 了 27 755 个 木质 纤维 素 降 


Singh Pg] 


高 通 量 测序 技术 对 印度 水 


H S REME 


天 的 基因 分 别 为 80 和 188 个 ， 这 
酶 提供 了 可 能 性 。Patel 等 外 利用 青草 、 干 草 饲 喂 水 牛 ， 采 相 


因 ， 其 中 糖苷 水 解 酶 (glycoside hydrolase, GH) 家 族 GH13 (3 442 个 ) 和 GH3 (2 844 个 ) 


些 基 因为 发 掘 


门 对 瘤 
FEW 


E 物 的 报道 。Hess 等 中 在 2011 


ASE 


瘤胃 中 GH28 及 果 胶 裂解 酶 的 基因 数 


牛 瘤 骨 微生物 宏基 因 组 进行 测序 ， 共 获得 了 1 


物 基因 组 进行 了 比 对 研究 , ROE 


MERR (contigs) ， 预 测 其 中 2 614 个 具有 降解 木质 纤维 素 的 功能 。 
E 较 大 差异 ， 


门 为 主 ， 厚 壁 菌 门 次 之 ， 相 对 丰 度 


最 高 的 属 为 普 雷 


Dn 


海子 水 


应 当地 的 自然 生态 条 件 ， 抗 逆 性 突 昌 


对 于 沼泽 型 水 牛 瘤胃 内 的 微生物 组 


s 


沃 菌 属 ， 
主 ， 拟 杆菌 门 次 之 ， 相 对 丰 度 最 高 的 属 为 瘤胃 球菌 科 下 未 分 类 上 


的 属 。 


E Ak cog Ug 
瘤胃 微生物 主要 以 
而 凑 便 中 的 微生物 以 厚 壁 


37 270 
NETS 
拟 杆菌 
菌 门 为 


属 沼泽 型 水 牛 ,分布 于 江苏 北部 沿海 地 区 ， 是 我 国 主要 的 地 方 良种 之 一 ,， 它 适 

bh， 耐 粗 饲 ， 在 草 质 较 差 的 情况 下 , 仍 能 较 好 地 生长 及 劳 

役 ， 可 见 海 子 水 牛 瘤胃 内 蕴藏 着 独特 的 木质 纤维 素 降解 微生物 和 酶 系 。 然 而 ， 到 目前 为 止 ， 

成 及 其 功能 基因 尚 鲜 见 报道 ,本 研究 借助 于 高 通 量 测序 技 

次 获得 海子 水 牛 瘤胃 微生物 的 宏基 因 组 数据 ， 经 数据 库 比 对 分 析 后 ， 获 得 功能 注释 ， 

结合 其 他 物种 肠胃 宏基 因 组 信息 进行 比 对 研究 , 骨 在 系统 探讨 海子 水 牛 瘤胃 内 的 微生物 组 成 
泽 酶 系 ， 以 期 从 中 发 掘 新 型 具有 工业 应 用 潜力 的 木质 纤维 素 降解 酶 。 


1 材料 与 方法 
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11 Rx 


ANE 


选取 3 头 2.5 岁 左右 的 海子 水 牛 ， 


天 饲 喂 2 次 ， 自 由 采 食 ， 饲 粮 组 成 及 营养 水 平 见 表 1。 饲 喂 60 d 后 进行 称 习 


刻 采 集 瘤 胃液 样品 ， 经 4 层 灭 菌 纱布 


在 相同 的 饲 粮 及 生活 环境 下 ,9 


过 滤 后 ， 迅 速 置 于 液 氮 中 。 


平均 体重 为 493 kg。 试 验 水 牛 的 饲养 管理 条 件 一 致 ， 每 


i] 


Be, Re 


瘤胃 内 的 微生物 群落 组 成 较为 相似 "0， 因 此 我 们 随机 


选取 1 头 海子 水 牛 的 瘤胃 液 进行 下 一 步 测序 分 析 。 


RI ， 饲 粮 组 成 及 营养 水 平 〈“ 风 干 基础 ) 


Table 1 Composition and nutrient levels of the diet (air-dry basis) % 
原料 含量 ”营养 水 平 含量 
Ingredients Content Nutrient levels Content 
青贮 玉米 Silage corn ”30.00 FH DM 96.06 


花生 身 Peanut vine 
稻草 Rice straw 
玉米 Corn 

米糠 Rice bran 
豆粕 Soybean meal 
小 麦 匣 Wheat bran 
合计 Total 


1.2 ”宏基 因 组 DNA 的 提取 


按照 QIAamp DNA micro kit ( 


10.00 ” 粗 蛋 白质 CP 9.80 
45.00 ”中 性 洗涤 纤维 NDF 50.23 
7.00 ”酸性 洗涤 纤维 ADF — 4246 
2.50 ”有机物 OM 87.98 
3.00 
2.50 
100.00 


德国 Qiagen) 试剂 盒 说 明 书 的 要 求 ， 进 行 瘤 骨 液 宏基 因 


组 DNA 的 分 离 和 纯化 。 使 用 1.0% 的 琼脂 糖 凝 胶 电 访 和 Nano Drop 分 光 光 度 计 ， 对 分 离 纯化 后 


的 DNA 进 行 检测 和 评价 。 


153 RA 


IH 


组 测序 及 分 析 


纯化 后 的 样品 送 上 海 欧 易 生物 公司 进行 


通 量 测序 。 首 先 利 用 Covaris M220 进 行 宏 基因 


E 
x 


组 DNA 片 段 化 处 理 ， 打 断 至 300 bp 左右 ， 末 端 连接 Y 字 形 接头 ， 通 过 接头 PCR 将 DNA 片 段 连 


接 到 芯片 上 形成 “ 桥 ” 并 制 成 文库 ， 


随后 通过 Illumina HiSeq 2000 高 通 量 测序 平台 进行 测序 。 


HH- 


获得 测序 数据 后 ， 首 先进 行 宿 


基因 的 过 滤 和 质量 剪 切 等 优化 处 理 ， 其 次 使 用 软件 


SOAP denovo 2.04 对 测序 数据 进行 拼 


接 组 装 ， 组 装 时 选用 的 kmer 参数 为 65; 然后 使 用 软件 


prodigal 2.6.3 对 基因 组 序列 进行 基因 


预测 ， 最 后 进行 数据 库 比 对 分 析 。 


通过 BLAST 将 预测 得 到 的 基因 序列 与 GenBank 的 非 元 余 核 背 酸 序列 数据 库 
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90 


91 


CNonredundant database, NR) 进行 比 对 (ftp://ftp.ncbi-nih.gov/pub/taxonomy ), 将 evalue<le-5 


的 序列 作为 有 意义 的 序列 ， 并 获得 物种 注释 信息 ; 最 后 将 预测 基因 与 COG 数据 库 


( ftp://ftp.ncbi.nih.gov/pub/COG/COG/kyva), GO 数据 库 (http://www.geneontology.org/) 和 


KEGG 数据 库 Chttp://www.genome.jp/kegg/pathway.html) 进行 比 对 ， 获 得 基因 功能 注释 。 


14 ”碳水 化 合 物 基因 分 析 


使 用 CAZy 数 据 Æ ( http//www.cazy.org/ ) 的 对 应 工具 hmmscan 


C http://hmmer.janelia.org/search/hmmscan) 将 预测 基因 与 CAZy 数 据 库 进 行 比 对 ， 获 得 基因 


对 应 的 碳水 化 合 物 活性 酶 注释 信息 , 然后 使 用 碳水 化 合 物 活性 酶 对 应 的 基因 丰 度 总 和 计算 该 


碳水 化 合 物 活性 酶 的 丰 度 。 根据 蛋白 质 结构 域 中 氨基 酸 序 列 的 相似 性 , 可 以 将 不 同 物种 来 源 


的 碳水 化 合 物 活性 酶 分 成 GH、 糖 基 转 移 酶 〈( glycosyl transferase, GT) 、 多 糖 裂 合 酶 
(polysaccharide lyase, PL) 、 碳 水 化 合 物 酯 酶 (carbohydrate esterase, CE) 、 碳 水 化 合 物 


结合 模块 (carbohydrate-binding module, CBM) 、 辅 助 氧化 还 原 酶 (auxiliary activity, AA) 


共 6 大 类 蛋白 质 家 族 。 同 时 将 海子 水 牛 的 CAZy 分 析 结 果 , 与 奶牛 及 印度 水 牛 瘤 肯 、 白 蚁 后 肠 
及 鸡 盲肠 宏基 因 组 中 的 CAZy 分 析 结 果 进 行 比 对 。 


2 结果 与 分 析 


2.1 宏基 因 组 测序 结果 


经 Illumina Hiseq 高 通 量 测序 平台 测序 ， 获 得 77 283 638 条 reads， 过 滤 水 牛 宿主 基因 


(GCA_000003055.5,Bostaurus Bos taurus UMD 3.1.1) 后 共 获 得 了 10.79 GB 的 测序 数 和 


mi 


o 


使 用 软件 SOAP denovo 2.04 对 测序 数据 进行 拼接 组 装 ， 共 得 到 744 712 个 scaffold, 2 250 


Mbp 的 宏基 因 组 序列 ( 表 2)。 
表 2 组 装 结果 统计 表 


Table 2 The result of the assembly 


项 目 Items Scaffold 
总 数 Total number/ 个 744 712 
总 长 度 Total length/bp 250 094 761 
Gap 数量 Gap No./ 个 1777 360 
平均 长 度 Average length/bp 336 
NSO 长 度 N50 length/bp 302 
N90 长度 N90 length/bp 210 

最 长 长 度 Maximum length/bp 185 379 
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100 


101 


102 


103 


最 短 长 度 Minimum length/bp 200 
GC 含量 GC content/% 46.14 


>H 


>H 


使 用 软件 prodigal 2.6.3 Xt AEF Ji ET 33 


预测 ,预测 得 到 氨基 酸 序 列 共 827 044 条 ， 


B 
EH 


平均 长 度 274 bp. 


22 ”基因 注释 结果 


将 827 044 条 基因 序列 与 NR 数据 库 进 行 BLAST 比 对 , 选取 evalue<1e-5 的 序列 , 共 498 


644 条 。 如 图 1 所 示 ， 与 NR 数据 库 中 序列 的 相似 度 主要 分 布 在 50% 以 上 ， 只 有 7.8% 的 序 


列 与 NR 数据 库 序列 高 度 相 似 〈( 相 似 度 >95%)， 表 明 此 次 测序 结果 中 含有 许多 新 基因 。 


50000 p 
45000 [ 
40000 
35000 
30000 


i 25000 


20000 


数量 


15000 
10000 
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0 


30 35 40 45 50 55 60 65 70 75 80 85 90 95 100 


相似 度 〈%) 


图 1 与 NR 数据 库 序 列 的 相似 度 


Fig.1 Similarity with sequences in NR database 


DH 


将 测序 数据 与 数据 库 比 对 , 获得 分 析 序 列 的 蛋白 功能 注释 信息 。 同 时 统计 基因 比 对 到 各 


个 物种 的 比例 ， 结 果 显 示 蛋 白 编码 大 


四 


来 源 于 拟 杆菌 门 (55.3%) HRE, HRV 


Sui 


于 厚 壁 菌 门 


的 比例 可 达到 12.7%,3.23% 及 2.7 1991] Ji 


四 


分 别 来 源 于 纤维 杆菌 门 及 变形 菌 门 〈 图 2) 。 
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= Bacteroidetes(55.396) = Actinobacteria(0.68%) Cyanobacteria(0.23%) 
E)! no rank phylum(22.7796) € Chlamydiae(0.65%) Euryarchaeota(0.2296) 
@ Firmicutes(12.796) = Merrucomicrobia(0.4 796) Planctomycetes(0. 1396) 
Wi Fibrobacteres(3.23%) ™ Spirochaetes(0.43?6) Acidobacteria(0. 1296) 
™ Proteobacteria(2.7196) 5 Tenericutes(0.2796) acteria(0.1196) 


104 

105 不 同 的 颜色 代表 不 同 的 门 ， 饼 面积 的 大 小 代表 注释 到 该 门 的 基因 的 比例 。 

106 Different colors represent different phyla, and the area shows the proportion of gene classified to the phylum. 

id 图 2 | 最 多 的 15 ATMA ^ 批注 [微软 用 户 1]: BER 


人 a 以 杆菌 门 Bacteroidetes(55.3%) 
108 Fig.2 Distribution of the top 15 phyla 未 分 类 门 No rank phylum (22.77%) 
厚 壁 菌 门 Firmicutes (12.70%) 


109 此 外 ， 将 样品 中 物种 水 平 上 的 分 类 层级 关系 绘制 成 进化 分 支 图 〈 图 3)， 从 根部 开始 向 纤维 杆菌 门 Fibrobacteres (3.23%) 
变形 菌 门 Proteobacteria (2.71%) 
110 ”外 ， 依 次 为 界 - 门 - 纲 - 目 - 科 - 属 -种 -菌株 的 分 类 。 共 分 类 出 来 了 3 个 界 : 细菌 界 、 古 菌 界 、 病 放 线 菌 门 Actinobacteria (0.68%) 
111 。 毒 界 ， 海 子 水 牛 瘤胃 中 的 微生物 大 部 分 为 细菌 界 。 在 菌株 的 分 类 中 ， 未 分 类 的 甲烷 短 杆菌 人 
PETAT] Verrucomicrobia (0.47%) 
112  (Methanobrevibacter unclassified) X fA Y^ RIK BE (Porcine sapelovirus) 分 别 属于 古 菌 界 及 病毒 螺旋 体 门 Spirochaetes (0.43%) 
柔 膜 菌 门 Tenericutes (0.27%) 
。 m4 共 测 得 菌株 ， 分 别 为 栖 瘤胃 普 雷 ; ini , 
113 ” 界 。 而 细菌 界 中 共 测 得 8 种 主要 菌株 ， 分 别 为 栖 瘤 胃 普 雷 沃 氏 菌 (Prevotella ruminicola) M cen Ca 
114 ” 生 黄 瘤胃 球菌 (Ruminococcus flavefaciens)、 白 色 瘤 胃 球 菌 CRuminococcus albus)、 未 分 类 广 古 菌 门 Euryarchaeota (0.22%) 
浮 霉 菌 门 Planctomycetes (0.13%) 
115 ”的 丁 酸 弧 菌 CButyrivibrio unclassified)、 链 球菌 (Streptococcus infantarius)、 密 螺旋 体 JC4 酸 杆菌 门 Acidobacteria (0.12%) 
fall] Fusobacteria (0.11%) 


116 (Treponema sp. JC4) KAH IE IE P ( Treponema bryantii)、 产 焉 珀 酸 纤 维 杆 菌 CFibrobacter 梭 杆 


117  succinogenes). 
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118 
119 A: 未 分 类 的 甲烷 短 杆 菌 Methanobrevibacter unclassified; B: 猪 萨 佩 罗 病毒 Porcine sapelovirus; C: 栖 瘤 
120 胃 普 雷 沃 氏 菌 Prevotella ruminicolas D: 生 黄 瘤胃 球菌 属 Ruminococcus flavefaciens; E: 白 色 瘤胃 球菌 属 


121 Ruminococcus albus; F: 未 分 类 的 丁 酸 弧 菌 属 Butyrivibrio unclassified; ，G: 链 球菌 Streptococcus infantarius; 


122 H: 梅 毒 螺 旋 体 菌 JC4 Treponema sp. JC4; I: 布 赖 恩 带 密 螺 旋 体 Treponema bryantii; J: 产 琥珀 酸 纤维 杆菌 属 
123 Fibrobacter succinogenes . 

124 43 物种 的 分 类 

125 Fig.3 The classification of species 


126 23 COG 数据 库 比 对 结果 
127 对 宏基 因 组 中 的 预测 基因 进行 COG 功能 分 类 预测 。 发 现 功能 集中 在 碳水 化 合 物 转运 及 


运 
128 ”代谢 的 基因 是 最 多 的 ， 数 量 达到 37 933 个 ， 由 此 可 见 该 宏基 因 组 内 可 能 含有 大 量 的 木质 纤 


129 ” 维 素 降解 酶 基因 (图 4)。 


COG Function Classification 


4 


130 Function Class 
131 A:RNA 加 工 和 修改 ”RNAprocessingandmodification ; B: 染色 质 结 构 与 动力 学 
132 ”Chromatinstructureanddynamics; C: 能 量 产生 和 转换 Energyproductionandconversion; DD: 细 胞 周期 控制 、 细 胞 


133 分 裂 、 染 色 体 分 区 Cellcyclecontrolcelldivision,chromosomepartitioning ; E: 氨 基 酸 运输 和 代谢 


Number of Genes 
1 1 1 1 1 J 
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135 
136 
137 
138 
139 
140 
141 
142 
143 
144 
145 
146 


147 


148 


149 


150 


151 


152 


153 


154 
155 
156 
157 
158 


Aminoacidtransportandmetabolism; 
F: 核 苷 酸 运 输 和 代谢 Nucleotidetransportandmetabolism ; G: 碳 水 化 合 物 的 运输 和 代谢 
Carbohydratetransportandmetabolism; 五 :辅酶 运输 和 代谢 Coenzymetransportandmetabolism; I: 脂 质 运输 和 代 
谢 Lipidtransportandmetabolism; J: 翻 译 ,核糖 体 结构 和 生物 转化 Translation,ribosomalstructureandbiogenesis; 
KK: 转 录 Transcription; 工 :复制 、 重 组 和 修复 Replicationrecombinationandrepair，M: 细 胞 壁 / 膜 / 包 膜 生物 合成 
Cellwall/membrane/envelopebiogenesis; N: 细 胞 活性 Cellmotility，O: 和 蛋白 质 转译 后 的 修改 ,蛋白 质 转 化 ,分 子 
tE 4B Posttranslationalmodification,proteinturnover,chaperones ; P: 无 机 离子 运输 和 代谢 
Inorganiciontransportandmetabolism ; Q: 次 生 代 谢 产 物 生 物 合 成 、 运 输 和 分 解 代 谢 
Secondarymetabolitesbiosynthesis,transportandcatabolism; R: 通 用 功能 预测 Generalfunctionpredictiononly 
S: 未 知 功能 Functionunknown; T: 信 号 转 导 机 入 
输 Intracellulartrafficking,secretion,andvesiculartransport; V: 防 御 机 制 Defensemechanisms; W: 细 胞 外 结构 
Extracellularstructures ; X: 移 动 基因 组 :噬菌体 原 , 转 座 子 Mobilome:prophages,transposons; Y: 核 结构 
Nuclearstructure; Z: 细 胞 骨架 Cytoskeleton. 


l| Signaltransductionmechanisms; U: 胞 内 运输 、 分 泌 和 膜 泡 运 


4 COG 分 类 


Fig.4 COG classification 


24 GO 分 类 结果 


对 得 到 的 基因 进行 GO 分 类 ， 统 计 基 因 在 生物 过 程 (biological process，BP)、 细 胞 成 分 


p 


(cellular component, CC) 和 分 子 功 能 (molecular function, MF) 3 个 GO 类 别 中 。 在 BP 


类 中 ， 集 中 在 代谢 、 细 胞 外 加 工 的 基因 最 多 ; 在 CC 类 中 ， 集 中 在 细胞 、 细 胞 组 分 的 在 


多 ; 在 MF 类 中 ， 和 外 


bs 
E 


中 在 结合 以 及 催化 功能 的 基因 最 多 (图 5)。 


ait 


gene ontology classification 


100 


percentage of genes 


Biological Process i Cellular Component Molecular Function 


AlZETISEIH biological adhesion;A2: 生 物 调 节 biological regulation;A3: 细 胞 死亡 cell killing;A4: 组 织 或 
生物 合成 细胞 组 件 cellular component organization or biogenesis;A5: 细胞 过 程 cellular process;A6: 发 育 过 程 
developmental process;A7: 定位 建立 establishment of localization;A8: 增长 growth;A9: 免疫 系统 的 过 程 


immune system process;Al0: 定位 localization;A11:4%2)) locomotion;A12: 代 谢 过 程 metabolic process;A13: 


21419 


gene number 


214 
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160 
161 
162 
163 
164 
165 
166 
167 
168 
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170 
171 
172 
173 
174 
175 
176 
177 
178 


179 


180 


181 


182 


183 


184 


185 


186 


187 


188 


189 


190 


多 细胞 生物 的 过 程 multicellular organismal process;A14: & 2H ZA fé multi-organism process;A15:^E Wit f Jc 


向 调节 negative regulation of biological process;A16: 生 物 过 程 正 向 调节 positive regulation of biological 
process;A17: 生 物 过 程 的 调节 regulation of biological process;A18: 繁 殖 reproduction;A19: 生 殖 过 程 


reproductive process;A20: 刺 激 反 应 response to stimulus;A21: 节律 过 程 rhythmic process;A22: 信号 
signaling;A23: 单 组 织 过 程 single-organism process;Bl: 细胞 cell;B2: 细胞 连接 celljunction;B3: 细胞 部 分 
cell part;B4: 细胞 外 基质 extracellular matrix;B5: 细胞 外 基质 部 分 extracellular matrix part;B6: 细胞 外 区 域 
extracellular region;B7: 细胞 外 区 域 部 分 extracellular region part;B8: 大 分 子 复合 物 macromolecular 


ng 


complex;B9: 膜 membrane;B10: 膜 部 分 membrane part;B11: 膜 封闭 腔 membrane-enclosed lumen;B12: 2% 
粒 体 相关 黏附 复合 体 mitochondrion-associated adherens complex;B13: 类 核 nucleoid;B14: 细胞 器 
organelle;B15: 细胞 器 的 部 分 organelle part;B16: 共 质 体 symplast;B17: 突 触 synapse;Bl8: 突 触 部 分 synapse 
part;B19 病毒 粒子 virion;B20: 病毒 粒子 部 分 virion part;C1: D- 丙 氨 栈 载体 功能 D-alanyl carrier activity;C2: 
抗 氧化 功能 antioxidant activity;C3: 结合 binding;C4: 催化 功能 catalytic activity;C5: 通道 调节 功能 channel 


regulator activity;C6: 化 学 引诱 物 功 能 chemoattractant activity;C7: 化 学 排斥 物 功 能 chemorepellent activity;C8: 


电子 载体 功能 electron carrier activity;C9: 酶 调节 功能 enzyme regulator activity;C10: 金属 伴侣 功能 
metallochaperone activity;C11: 分 子 传感器 功能 molecular transducer activity;C12: 成 形 素 功能 morphogen 
activity;C13: 核酸 结合 转录 因子 功能 nucleic acid binding transcription factor activity;C14: 营养 储存 功能 


nutrient reservoir activity;C15: 蛋白 结合 转录 因子 功能 protein binding transcription factor activity;C16: 蛋白 


质 标记 protein tag;C17: 受 体 功 能 receptor activity;C18: 受 体 调节 功能 receptor regulator activity;C19: 结构 
分 子 功能 structural molecule activity;C20: 翻译 调节 功能 translation regulator activity;C21: 运输 功能 


transporter activity. 


A 代表 注释 到 BP 的 条 目 ，B 代表 注释 到 CC 的 条 目 ，C 代表 注释 到 MF 的 条 目 ， 横 坐标 为 条 目 名 称 ， 


纵 坐 标 表示 条 目的 数量 或 比例 。 
A represents the term of BP, B represents the term of CC, and C represents the term of MF. The abscissa was 


term name, and the ordinate was the number or percentage of term. 


45 最 多 的 20 个 CO 条目 分 类 


Fig.5 Top 20 GO terms classification 


2.5 KEGG 分 析 结 


105 560 个 基因 被 富 集 到 247 条 KEGG 通路 中 ， 表 3 为 富 集 最 明显 的 前 10 条 KEGG 通 


T 


路 。 大 部 分 基因 被 富 集 在 小 分 子 的 代谢 中 ， 如 氢 基 酸 的 生物 合成 、 味 叭 代谢 、 喀 啶 代谢 、 碳 


p 


代谢 、 氨 酰 tRNA 的 生物 合成 等 。 此 外 ， 还 有 5236 


I 
Ha 

um 
o 
A 


EEA AE MARS HP 


#3 富 集 最 明显 的 10 条 KEGG 通路 


Table 3 Top 10 obviously gathered KEGG pathways 


通路 Pathways 描述 Description 基因 数量 Gene No./ 个 
ko01230 氨基 酸 的 生物 合成 13 393 
ko00230 (C 10 717 


ko01200 DAR 10 664 
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191 


192 


193 


194 


195 


196 


ko00240 
ko00970 
ko00500 
ko00520 
ko00250 
ko00010 
ko03010 


2.6 CAZy 数据 库 比 对 结果 


Ly Fs 


AER A Ceohesin) £i 


经 hmmscan 分 析 , 发 现 有 38 011 个 基因 比 对 到 CAZy 数据 库 中 , 统计 结果 如 


因 组 中 的 GH 基因 数量 最 多 (17 877 40. GT (8 637 个 ) ~ CBM (4693 个 ) 


homology, SLH). 


Number of Genes 


igo (C 

AWE CRNA 的 生物 合成 
VERUS BH UR 
氨基 糖 和 核 苷 酸 糖 代谢 
丙 氨 酸 代谢 
wR. HGRA 


HT 


CAZy Category 


AA CBM CE GH 


Function Class 


GT 


9 467 
7 106 
5236 
5 200 
5159 
4 969 
4872 


因 (4214 4^) WZ, PL 和 44 基因 较 少 ， 数 量 分 别 为 1296 和 934 个 。 此 外 还 发 


因 、236 SEAR A (dockerin) 基因 以 及 82 个 8 


PL 


图 6 所 示 ， 


层 同 源 结构 


和 CE d 
BT 42 个 


或 (S-layer 


AA: 辅助 氧化 还 原 酶 ，CBM: 碳水 化 合 物 结合 模块 ，CE: 碳水 化 合 物 酯 酶 ，GH: WEKEN: GT: 


糖 基 转移 酶 ，PL:， 多 糖 裂 合 酶 。 


44: auxiliary activity CBM: carbohydrate binding modules; CE: carbohydrate esterases; GH: glycosyl 


hydrolases; GT: glycosyl transferases; PL: polysaccharide lyases. 


图 6 CAZy 数据 库 比 对 结果 


Fig.6 Distribution of CAZyme encoding genes 


17 877 个 GH 基因 


分 布 在 


E 不 同 的 GH 基因 家 族 ， 其 中 GH2、GH43、GH97、GH3 家 族 


因 较 多 ，GHI12 和 GH62 家 族 的 基因 最 少 ( 表 4)。 瘤胃 中 的 木质 纤维 素 降解 酶 可 水 解 植 
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206 ” 物 细 胞 壁 中 的 纤维 素 和 半 纤 维 素 , 根据 水 解 底 物 类 型 的 不 同 , 可 将 海子 水 牛 瘤胃 宏基 因 组 K 

207 ”的 GH 基因 家 族 分 类 ( 表 5)， 有 932 个 基因 编码 的 蛋白 质 有 具备 纤维 素 酶 活性 ， 其 中 GHS 及 

208 ”GH9 基因 家 族 的 数量 较 多 ;1 011 个 基因 编码 的 蛋白 具备 半 纤 维 素 酶 活性 ， 其 中 GH10 基因 

209 ”家 族 的 基因 数量 最 多 ; 分 支 降解 酶 (GH67 和 GH78) 的 编码 基因 共有 538 4; 3 266 个 基因 

210 — Auf AA SERE PEE TS TE, Fh GH2 基因 家 族 的 基因 数量 最 多 。 

211 表 4 海子 水 牛 瘤胃 微生物 宏基 因 组 中 GH 基因 的 分 布 

212 Table 4 Distribution of GH genes in Haizi buffalo rumen microorganism metagenome 
SHA Items 数量 No./ 个 ”项目 Items 数量 No. 项目 Items 数量 No./ 个 
糖苷 水 解 酶 1 GHI 31 糖苷 水 解 酶 47 GH47 8 糖苷 水 解 酶 93 GH93 27 
糖苷 水 解 酶 2 GH2 1732 糖苷 水 解 酶 48 GH48 6 糖苷 水 解 酶 94 GH94 290 
糖 昔 水解 酶 3 GH3 860 糖 昔 水 解 酶 49 GH49 6 糖苷 水 解 酶 95 GH95 547 
糖 昔 水解 酶 4 GH4 105 糖 昔 水 解 酶 50 GH50 99 糖苷 水 解 酶 96 GH96 13 
糖 昔 水 解 酶 5 GHS 515 糖 昔 水 解 酶 51 GH51 396 糖苷 水 解 酶 97 GH97 940 
糖 昔 水解 酶 6 GH6 15 糖 昔 水 解 酶 52 GH52 7 糖苷 水 解 酶 98 GH98 15 
糖苷 水 解 酶 7 GH7 9 糖苷 水 解 酶 53 GH53 158 糖苷 水 解 酶 99 GH99 42 
糖苷 水 解 酶 8 GH8 130 糖 苦水 解 酶 54 GH54 54 糖苷 水 解 酶 100 GH100 8 
糖苷 水 解 酶 9 GH9 337 BEE 7K MERE 55 GH55 61 糖苷 水 解 酶 101 GH101 7 
糖苷 水 解 酶 10 GH10 360 BE 7K MERE 56 GH56 9 糖苷 水 解 酶 102 GH102 14 
糖苷 水 解 酶 11 GH11 56 糖 昔 水 解 酶 57 GH57 143 糖苷 水 解 酶 103 GH103 18 
糖苷 水 解 酶 12 GH12 3 BE AK MERE 58 GH58 5 糖苷 水 解 酶 104 GH104 13 
糖苷 水 解 酶 13 GH13 679 糖苷 水 解 酶 59 GH59 25 糖苷 水 解 酶 105 GH105 204 
糖苷 水 解 酶 14 GH14 8 糖 昔 水 解 酶 62 GH62 3 糖苷 水 解 酶 106 GH106 310 
糖 昔 水 解 酶 15 GH15 1 糖苷 水 解 酶 63 GH63 18 糖苷 水 解 酶 107 GH107 13 
糖苷 水 解 酶 16 GH16 192 HEE KIENS 64 GH64 8 糖苷 水 解 酶 108 GH108 26 
糖苷 水 解 酶 17 GH17 13 糖苷 水 解 酶 65 GH65 22 糖苷 水 解 酶 109 GH109 315 
糖苷 水 解 酶 18 GH18 119 糖苷 水 解 酶 66 GH66 60 糖苷 水 解 酶 110 GH110 61 
糖 昔 水 解 酶 19 GH19 5 糖苷 水 解 酶 67 GH67 115 糖苷 水 解 酶 111 GH111 5 
糖苷 水 解 酶 20 GH20 401 糖 昔 水 解 酶 68 GH68 6 糖苷 水 解 酶 112 GH112 10 
糖苷 水 解 酶 22 GH22 6 糖 昔 水 解 酶 70 GH70 15 糖苷 水 解 酶 113 GH113 18 
糖苷 水 解 酶 23 GH23 266 糖苷 水 解 酶 71 GH71 9 糖苷 水 解 酶 114 GH114 20 
糖苷 水 解 酶 24 GH24 68 糖苷 水 解 酶 72 GH72 5 糖苷 水 解 酶 115 GH115 320 
糖苷 水 解 酶 25 GH25 275 BE 7k eR 73 GH73 187 糖苷 水 解 酶 116 GH116 23 
糖 昔 水解 酶 26 GH26 63 糖 昔 水 解 酶 74 GH74 199 糖苷 水 解 酶 117 GH117 21 
糖苷 水 解 酶 27 GH27 59 糖 昔 水 解 酶 75 GH75 4 糖苷 水 解 酶 118 GH118 9 
糖苷 水 解 酶 28 GH28 302 糖 昔 水 解 酶 76 GH76 75 糖苷 水 解 酶 116 GH119 201 
糖苷 水 解 酶 29 GH29 368 糖苷 水解 酶 77 GH77 310 糖苷 水 解 酶 120 GH120 18 
糖苷 水 解 酶 30 GH30 92 糖 苦水 解 酶 78 GH78 423 糖苷 水 解 酶 121 GH121 25 
糖苷 水 解 酶 31 GH31 544 糖 苦水 解 酶 79 GH79 11 糖苷 水 解 酶 122 GH122 9 
糖苷 水 解 酶 32 GH32 89 糖 昔 水 解 酶 80 GH80 18 糖苷 水 解 酶 123 GH123 50 
糖苷 水 解 酶 33 GH33 90 糖 昔 水 解 酶 81 GH81 4 糖苷 水 解 酶 124 GH124 45 


PEE 12 糖苷 水 解 酶 82 GH82 29 糖苷 水 解 酶 125 GH125 52 
PAE 88 糖苷 水 解 酶 83 GH83 52 糖苷 水 解 酶 126 GH126 8 
PEE 218 糖 昔 水 解 酶 84 GH84 32 糖苷 水 解 酶 127 GH127 258 
PAE 30 糖苷 水 解 酶 85 GH85 19 糖苷 水 解 酶 128 GH128 14 
糖苷 可 47 糖 昔 水 解 酶 86 GH86 8 糖苷 水 解 酶 129 GH129 31 
PEE 91 糖苷 水 解 酶 87 GH87 24 糖苷 水 解 酶 130 GH130 147 
糖苷 水 解 酶 42 GH42 49 BE 7K MERE 88 GH88 36 糖苷 水 解 酶 131 GH131 7 
糖 昔 水解 酶 43 GH43 1 105 糖 昔 水 解 酶 89 GH89 199 糖苷 水 解 酶 132 GH132 4 
糖苷 水 解 酶 44 GH44 28 糖 昔 水 解 酶 90 GH90 9 糖苷 水 解 酶 133 GH133 167 
糖苷 水 解 酶 45 GH45 52 糖 昔 水 解 酶 91 GH91 13 糖苷 水 解 酶 134 GH134 8 
糖苷 水 解 酶 46 GH46 16 糖苷 水 解 酶 92 GH92 602 糖苷 水 解 酶 135 GH135 13 
213 表 5 不 同 动物 的 微生物 宏基 因 组 中 GH 基因 的 分 布 
214 Table 5 Distribution of GH genes in microorganism metagenome in different animals 
项 目 Items 海子 水 牛 瘤胃 奶牛 瘤胃 印度 水 牛 瘤胃 蚁 后 肠 鸡 盲肠 
Haizi buffalo rumen Dairy cow Indian buffalo rumen?! Termite Chicken 
rumen"! hindgut" 4 cecum!) 
纤维 素 酶 Cellulases 
糖苷 水 解 酶 5 GHS 2.88 3.85 1.50 5.71 0.19 
糖苷 水 解 酶 9 GH9 1.89 2.2 0.26 2.37 0.23 
pen OK HF BE 44 GH44 0.16 0.07 0.00 0.32 0.00 
Suk HERS 45 GH45 0.29 0.27 0.05 0.51 0.00 
Crit Total 5.22 6.39 1.81 8.91 0.43 
PFF AER AE Hemicellulases 
于 糖苷 水 解 酶 8 GHB 0.73 0.76 0.00 0.83 0.08 
[a C. 10 GH10 2.01 1.65 2.64 5.39 0.62 
Orr wens 11 GH11 0.31 0.69 0.15 1.09 0.00 
BEEKIE 26 GH26 0.91 0.76 1.03 1.28 0.27 
[i Et 7K fe 28 GH28 1.69 0.48 0.21 0.77 0.51 
合计 Total 5.65 434 4.04 9.36 1.48 
分 支 降 解 酶 Debranching enzymes 
EKENS 67 GH67 0.64 0.62 2.49 1.34 0.47 
CRE EEE 78 GH78 2.37 3.85 2.85 0.44 2.84 
= "Sit Total 3.01 4.47 5.34 1.78 3.31 
» 过 亮 糖 降解 酶 Oligosaccharide degrading enzymes 
同音 水 解 酶 1 GHI 0.17 0.21 0.05 1.86 3.86 
EEKAN 2 GH2 9.69 11.68 9.85 4.36 12.24 
往昔 水 解 酶 3 GH3 4.81 13.87 18.30 11.94 8.92 
ass 糖苷 水 解 酶 29 GH29 2.06 2.06 2.28 0.89 2.14 
nikon 35 GH35 0.49 0.62 0.78 0.38 1.09 
hie i wee 38 GH38 0.26 0.89 0.26 2.63 1.21 
糖苷 水 解 酶 39 GH39 0.51 0.21 0.00 0.44 0.00 
糖苷 水 解 酶 42 GH42 0.27 0.27 0.10 2.76 0.94 
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合计 Total 18.26 29.81 31.62 2528 30.4 


215 3 dw it 


216 本 试验 通过 高 通 量 测序 技术 对 海子 水 牛 瘤胃 液 样本 进行 组 学 分 析 ,， 共 获得 了 77283 638 


217 ”条 reads， 并 拼接 出 744 712 个 Scaffold。 将 测序 数据 与 COG 数据 库 进 行 比 对 发 现 ， 功 能 集 


218 ”中 在 碳水 化 合 物 转运 及 代谢 的 基因 是 最 多 的 ， 除 此 之 外 ， 富 集 在 氨基 酸 运输 及 代谢 、 细 胞 壁 


TT 


219 ”及 细胞 膜 生物 合成 基因 也 较 多 ， 这 与 印度 水 牛 的 报道 相似 由。 在 GO 分 类 分 析 中 发 现 ， 集 中 
220 ”在 结合 以 及 催化 功能 的 基因 最 多 。 由 此 可 见 , 海子 水 牛 瘤胃 宏基 因 组 内 可 能 含有 大 量 的 木质 


221 ”纤维 素 降 解 酶 基因 。 


222 根据 基因 注释 到 物种 的 比例 可 知 ， 来 源 于 拟 杆 菌 门 的 基因 较 多 ， 可 占 55.3%。Jami 等 站 


223 ”在 奶牛 瘤胃 中 也 发 现 了 相同 的 微生物 分 布 。 此 外 ,根据 物种 分 类 结果 可 知 , 海子 水 牛 瘤胃 中 
224 ”的 微生物 大 部 分 为 细菌 界 , 其 中 的 生 黄 瘤胃 球菌 、 白色 瘤胃 球菌 及 产 琥 珀 酸 丝 状 杆菌 可 产 出 
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225 ”大 量 的 纤维 素 酶 降解 饲 粮 中 的 木质 纤维 素 ， 被 认为 是 瘤胃 中 降解 木质 纤维 素 的 主要 微生物 ， 
226 而 栖 瘤 胃 普 需 沃 氏 菌 可 降解 木 聚 糖 及 果 胶 0 P1, 

227 纤维 素 酶 、 半 纤维 素 酶 及 果 胶 酶 的 协同 作用 可 降解 植物 的 细胞 壁 ， 为 反刍 动物 提供 营养 
228 ”物质 ， 而 这 3 类 酶 基因 均 存 在 于 海子 水 牛 的 瘤 角 中 。GHS 及 GH9 基因 家 族 的 含量 较 高 ， 
229 ”者 可 达到 GH 基因 总 量 的 4.77%。GH10、GH11、GH26 和 GH28 家 族 的 酶 具有 半 纤 维 素 酶 
230 ”活性 ， 其 中 GH10 和 GH11 家 族 属于 木 聚 糖 酶 ， 它 能 从 木 聚 糖 主 链 的 内 部 随机 切割 B-1,4 木 
231 ”糖苷 键 ， 将 其 降解 为 低 聚 木 糖 和 少量 木 糖 ， 而 CE1、CE4、CE6 及 CE7 家 族 的 木 聚 糖 酯 酶 
232 ”可 作用 于 木 聚 糖 的 支 链 &19。 此 外 ，PL1、PL9 及 PLIO 家 族 的 酶 具有 果 胶 裂解 酶 活性 ， 而 
233. CE8 家 族 的 酶 具有 果 胶 甲 基 酯 酶 活性 ， 可 脱 去 果 胶 中 的 甲 酯 基 团 ， 生 成 果 胶 酸 中 。 在 GH 
234 ”分 类 中 ， 窒 糖 降解 酶 的 比例 最 高 ， 可 能 是 由 于 经 过 纤维 素 酶 、 半 纤维 素 酶 及 果 胶 酶 的 协同 作 
235 后 , 植物 细胞 壁 被 降解 为 大 量 的 低 聚 赛 糖 ， 这 些 物 质 需 要 被 进一步 降解 后 才 可 被 反刍 动物 
236 RR. TSE AE PY GH2 家 族 的 酶 数量 最 多 ， 主 要 包括 B-D- 半 乳糖 将 酶 、B- 葡 萄 
237 ” 糖 醛 酸 酶 、B-D- 甘 露 糖 昔 酶 及 外 切 B- 氨 基 葡 萄 糖苷 酶 !]。 

238 此 外 ， 本 试验 还 在 海子 水 牛 瘤胃 内 发 现 了 42 ADEE AE. 236 个 对 接 蛋 白 基 因 以 
239 ”及 82 个 S 层 同 源 结构 域 ,它们 均 是 构成 纤维 小 体 的 组 分 。 纤 维 小 体 是 一 种 由 木质 纤维 素 降 
240 ” 解 酶 依靠 脚手架 蛋白 形成 的 多 酶 复合 体 "小 ， 并 借助 笑 附 蛋白 固定 于 细胞 表面 ， 可 持续 、 高 
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241 «= MH ERR RAPER. AO EAE HOA S RAA A CUR ARAPE T Ae, Hess 
242 Ee SL ye EI Abe Se Pe ELIO DSL 43-90] 7. 80 和 188 个 。 
243 Mr T ok A IURE FERE DL UR IK A RD, ABUA ROS R A d 


244 ” 因 组 数据 中 的 GH 基因 进行 分 类 比 对 ,发 现在 不 同 的 宏基 因 组 中 , 寡 糖 降解 酶 比例 均 为 最 高 。 


245 ”但 与 其 他 4 种 动物 肠胃 微生物 宏基 因 组 相 比 , 海子 水 牛 中 的 守 糖 降解 酶 数量 最 少 。 海子 水 牛 
246 ”和 奶牛 瘤胃 宏基 因 组 中 的 纤维 素 酶 、 半 纤维 素 酶 和 分 支 降 解 酶 比例 接近 。 印 度 水 牛 中 的 纤维 
247 ” 素 酶 最 少 , 但 寡 糖 降解 酶 最 多 。 海 子 水 牛 瘤胃 中 纤维 素 酶 及 寡 糖 降解 酶 的 比例 与 印度 水 牛 瘤 


248 ” 胃 存 在 许多 不 同 , 这 可 能 与 2 种 水 牛 饲 粮 中 粗饲料 与 精 饲 料 的 比例 有 关 ， 印度 水 牛 饲 粮 中 粗 
249 ”饲料 与 精 饲料 的 比例 为 75:25， 而 海子 水 牛 的 则 为 85:15， 粗 饲料 含量 高 可 能 导致 瘤胃 内 存 


250 ”在 高 比例 的 纤维 素 酶 和 低 比 例 的 寡 糖 降解 酶 。 但 在 GH 基因 家 族 分 布 中 ，2 种 水 牛 瘤胃 中 


251  GH6. GH7. GH12. GH48 及 GH62 家 族 基 因数 量 均 较 少 外 。 白 蚁 后 肠 微生物 宏基 因 组 中 的 


252 ”纤维 素 酶 和 半 纤 维 素 酶 基因 最 多 ， 其 中 GH5 (5.71%) 和 GHIO (5.39%) 家 族 的 基因 比例 


253 ”最 高 , 主要 是 由 于 木材 中 纤维 素 及 半 纤 维 素 的 比例 高 于 牧草 。 鸡 盲肠 中 的 纤维 素 酶 及 半 纤 维 
254 ” 素 酶 的 比例 最 低 ， 但 赛 糖 降解 酶 比例 较 高 。 由 此 可 见 宿主 基因 型 及 饲料 的 不 同 可 影响 肠胃 
255 ”GH 基因 的 组 成 。 


Ml 


= 


256 4 4 it 


257 纪 通 过 高 通 量 测序 发 现 海子 水 牛 瘤胃 中 含有 多 种 木质 纤维 素 降解 微生物 , 如 生 黄 瘤 骨 球 
258 ” 菌 、 白 色 瘤 骨 球 菌 、 产 琥珀 酸 丝 状 杆菌 及 栖 瘤胃 普 雷 沃 氏 菌 。 可 见 ， 海 子 水 牛 瘤胃 内 含有 丰 


259 富 的 木质 纤维 素 降解 微生物 。 


260 @ 水 牛 瘤胃 中 还 含有 大 量 的 糖苷 水 解 酶 基因 ， 其 中 GH2. GH43. GH97. GH3 家 族 的 


261 ”基因 较 多 ， 且 编码 蛋白 具有 寡 糖 降解 酶 活性 的 基因 数量 最 多 。 可 见 ， 海 子 水 牛 瘤胃 内 含有 丰 
262 ” 富 的 木质 纤维 素 降解 酶 系 。 
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Abstract: In order to investigate microorganism composition and lignocellulolytic enzymes in 
rumen of Haizi buffalo, rumen fluid sample of Haizi buffalo (about 2.5 years of age, average 
body weight was 493 kg) was surveyed using metagenomic high-throughput sequencing. The 
results showed as follws: a total of 77 283 638 reads were obtained, which were assembled into 
744 712 scaffolds. And then, a total of 827 044 genes were predicted by prodigal analysis. Many 
microorganisms involved in lignocellulose degradation were identified by gene annotation, such 
as Ruminococcus flavefaciens, Ruminococcus albus, Fibrobacter succinogenes and Prevotella 
ruminicola. We identified potential 38 011 genes encoding lignocellulolytic enzymes including 
glycoside hydrolase (GH) (17 877 genes), glycosyl transferase (GT) (8 637 genes), carbohydrate 
binding module (CBM) (4 693 genes), carbohydrate esterase (CE) (4 214 genes), polysaccharide 
lyase (PE) (1 296 genes), and auxiliary activity (44) (934 genes). Among GH genes, most genes 
belonged to GH2, GH43, GH97 and GH3 families, and a higher abundance of oligosaccharide 
degrading enzymes in buffalo rumen metagenome was identified. Besides that, we also predicted 
that some genes could encode the cellulosome component. Compared with GH genes in the 
gastrointestinal metagenome of other species, the proportions of cellulose, hemicellulase and 
debranching enzyme were similar between Haizi buffalo and dairy cow. These results demonstrate 
that buffalo rumen is considerably enriched in functional microorganisms and enzymes involved 
in lignocellulose degradation with great prospects to obtain enzyme genes that may be applied in 
the industry. 


Key words: Haizi buffalo; rumen; metagenome; microorganism; lignocellulolytic enzyme 
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